How Formula 1® uses generative AI to accelerate race-day issue resolution
在这篇文章中,我们解释了F1和AWS如何开发由亚马逊基岩提供动力的根本原因分析(RCA)助理,以减少手动干预并加速在几周到几分钟内的比赛中分辨出复发性的操作问题。 RCA助理使F1团队能够花更多的时间在创新上并改善其服务,最终为粉丝和合作伙伴提供了非凡的体验。 F1和AWS之间的成功合作展示了生成AI在赋予团队能力以更少的时间内完成的变革潜力。
Build a dynamic, role-based AI agent using Amazon Bedrock inline agents
在这篇文章中,我们探讨了如何使用Amazon Bedrock Inline Agents构建应用程序,并演示了单个AI助手如何根据用户角色动态调整其功能。
Use language embeddings for zero-shot classification and semantic search with Amazon Bedrock
在这篇文章中,我们探讨了哪些语言嵌入方式以及如何使用它们来增强您的应用程序。我们展示了如何通过使用嵌入式的属性来实现实时零击分类器,并可以添加强大的功能,例如语义搜索。
Achieve ~2x speed-up in LLM inference with Medusa-1 on Amazon SageMaker AI
研究人员开发了 Medusa,这是一个通过添加额外头来同时预测多个标记以加快 LLM 推理速度的框架。这篇文章演示了如何使用框架的第一个版本 Medusa-1 通过在 Amazon SageMaker AI 上对其进行微调来加速 LLM,并通过部署和简单的负载测试确认了加速效果。Medusa-1 在不牺牲模型质量的情况下实现了约两倍的推理加速,具体改进取决于模型大小和使用的数据。在这篇文章中,我们通过在样本数据集上观察到 1.8 倍的加速来证明其有效性。
From concept to reality: Navigating the Journey of RAG from proof of concept to production
在本文中,我们探讨了 RAG 应用程序从概念验证或最小可行产品 (MVP) 阶段向成熟生产系统的转变。在将 RAG 应用程序从概念验证过渡到可用于生产的系统时,优化变得至关重要,以确保解决方案可靠、经济高效且性能卓越。
Falcon 3 models now available in Amazon SageMaker JumpStart
我们很高兴地宣布,TII 的 Falcon 3 系列模型已在 Amazon SageMaker JumpStart 中推出。在本文中,我们将探讨如何在 Amazon SageMaker AI 上高效部署此模型。
Building a virtual meteorologist using Amazon Bedrock Agents
在本文中,我们介绍了一种通过结合 Amazon Bedrock Agents 和基础模型 (FM) 来部署 AI 驱动代理的简化方法。我们将指导您完成配置代理和实现虚拟气象学家提供准确天气相关响应所需的特定逻辑的过程。
Faster distributed graph neural network training with GraphStorm v0.4
GraphStorm 是一个低代码企业图形机器学习 (ML) 框架,为 ML 从业者提供了一种在行业规模图形数据上构建、训练和部署图形 ML 解决方案的简单方法。在这篇文章中,我们展示了 GraphBolt 如何在分布式设置中增强 GraphStorm 的性能。我们提供了一个在 SageMaker 上使用 GraphStorm 和 GraphBolt 进行分布式训练的实际示例。最后,我们分享了如何将 Amazon SageMaker Pipelines 与 GraphStorm 结合使用。
Transforming credit decisions using generative AI with Rich Data Co and AWS
Rich Data Co (RDC) 的使命是在全球范围内扩大可持续信贷的获取渠道。其软件即服务 (SaaS) 解决方案为领先的银行和贷方提供了深入的客户洞察和 AI 驱动的决策能力。在这篇文章中,我们讨论了 RDC 如何使用 Amazon Bedrock 上的生成式 AI 来构建这些助手并加速其实现民主化获取可持续信贷的总体使命。
Build agentic AI solutions with DeepSeek-R1, CrewAI, and Amazon SageMaker AI
在这篇文章中,我们将演示如何将 DeepSeek-R1 等 LLM(或您选择的其他 FM)从 SageMaker JumpStart 或 Hugging Face Hub 等热门模型中心部署到 SageMaker AI 进行实时推理。我们探索了 Hugging Face TGI 等推理框架,它有助于简化部署,同时集成内置性能优化以最大限度地减少延迟并最大限度地提高吞吐量。此外,我们还展示了 SageMaker 开发人员友好的 Python SDK 如何简化端点编排,从而实现 LLM 支持的应用程序的无缝实验和扩展。
Automate bulk image editing with Crop.photo and Amazon Rekognition
在本文中,我们将探讨 Crop.photo 如何使用 Amazon Rekognition 提供复杂的图像分析,从而实现对大量图像的自动精确编辑。这种集成简化了客户的图像编辑流程,提供了速度和准确性,这在快节奏的电子商务和体育环境中至关重要。
Revolutionizing business processes with Amazon Bedrock and Appian’s generative AI skills
AWS 和 Appian 的合作标志着业务流程自动化的重大进步。通过利用 Amazon Bedrock 和 Anthropic 的 Claude 模型的强大功能,Appian 使企业能够优化和自动化流程,从而提高效率和效力。这篇博文将介绍 Appian AI 技能如何将自动化融入组织的关键任务流程,以提高卓越运营、降低成本并构建可扩展的解决方案。
Governing the ML lifecycle at scale, Part 4: Scaling MLOps with security and governance controls
这篇文章提供了设置多账户 ML 平台关键组件的详细步骤。这包括配置 ML 共享服务账户,该账户管理中央模板、模型注册表和部署管道;从中央服务目录共享 ML Admin 和 SageMaker 项目组合;以及设置单独的 ML 开发账户,数据科学家可以在其中构建和训练模型。
Accelerate your Amazon Q implementation: starter kits for SMBs
入门套件是完整的可部署解决方案,可解决常见的可重复业务问题。它们根据最佳实践部署构成解决方案的服务,帮助您优化成本并熟悉这些类型的架构模式,而无需在培训方面进行大量投资。在这篇文章中,我们展示了 Amazon Q Business 的入门套件。如果您有一个文档存储库,需要将其快速转换为知识库,或者只是想测试 Amazon Q Business 的功能而又不需要在控制台上投入大量时间,那么此解决方案非常适合您。
Building the future of construction analytics: CONXAI’s AI inference on Amazon EKS
CONXAI Technology GmbH 正在率先为建筑、工程和施工 (AEC) 行业开发先进的 AI 平台。在这篇文章中,我们深入探讨了 CONXAI 如何使用 Amazon Simple Storage Service (Amazon S3)、Amazon Elastic Kubernetes Service (Amazon EKS)、KServe 和 NVIDIA Triton 在 AWS 上托管最先进的 OneFormer 细分模型。
How Untold Studios empowers artists with an AI assistant built on Amazon Bedrock
Untold Studios 是一家技术驱动的领先创意工作室,专门从事高端视觉效果和动画。 这篇文章详细介绍了我们如何使用 Amazon Bedrock 创建 AI 助手 (Untold Assistant),通过直接集成到他们现有 Slack 工作流程中的自然语言界面,为艺术家提供了一种直接访问我们内部资源的方法。
Protect your DeepSeek model deployments with Amazon Bedrock Guardrails
本博客文章提供了使用 Amazon Bedrock Guardrails 为 DeepSeek-R1 和其他开放权重模型实施强大安全保护的全面指南。通过遵循本指南,您将学习如何使用 DeepSeek 模型的高级功能,同时保持强大的安全控制并促进合乎道德的 AI 实践。
Fine-tune and host SDXL models cost-effectively with AWS Inferentia2
随着技术的不断发展,新的模型不断涌现,提供更高的质量、更大的灵活性和更快的图像生成功能。StabilityAI 发布的 Stable Diffusion XL (SDXL) 就是这样一种突破性的模型,它将文本到图像的生成 AI 技术推向了前所未有的高度。在这篇文章中,我们演示了如何使用 SageMaker Studio 有效地微调 SDXL 模型。我们展示了如何准备经过微调的模型以在由 AWS Inferentia2 提供支持的 Amazon EC2 Inf2 实例上运行,从而为您的推理工作负载带来卓越的性价比。